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摘 要 : [目的 /意义 ] 提 出 和 构建 网 络 和 与 情 观 点 团 徐 演 化 等 级 ,以 描述 网 络 与 情 受众 的 群体 性 观点 的 状态 随时 间 与 事态 交 
化 的 演化 程度 ,对 于 网 络 和 与 情 导 控 与 精准 引导 具有 重要 的 理论 及 实践 意义 。[ 方 法 /过 程 ] 基 于 LDA 与 CNN 神经 
网 络 构建 网 络 与 情 观 点 团 徐 演 化 等 级 测度 模型 ,并 以 “ 翟 天 临 知 网 事件 ”为 实验 对 象 , 验 证 演化 等 级 这 一 指标 的 有 
效 性 。|[ 结果 /结论 ] 网 络 和 与 情 观 点 团 秘 演 化 等 级 能 够 很 好 地 体现 网 络 热 点 事件 群体 观点 状态 的 演化 ,在 展现 3 个 
维度 的 属性 数值 同时 也 能 反映 观点 团 徐 较 前 一 时 间 节 点 状态 的 演化 程度 ,提出 的 观点 团 徐 演 化 等 级 测度 结果 精 
准 地 体现 事件 观点 的 各 个 演化 高 峰 , 为 有 关 部 门 对 网 络 与 情 群 体 观 点 的 靶 向 引导 提供 新 的 指导 方向 。 
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@ 在 当前 互联 网 技术 快速 革新 的 今天 ,新 媒体 的 莲 
翰 舌 展 推动 了 网 络 用 户 数量 的 高 速 增长 ,形成 了 当前 
复 毁 多 变 的 网 络 奥 情 生态 环境 。 网 络 与 情 个 体 观点 是 
基于 个 体 的 立场 观念 . 认 知 水 平等 思维 模式 所 形成 
的 5 好 有 极 强 的 主观 性 ,在 个 体 观 点 形成 的 过 程 中 受 其 
代 驳 点 的 影响 ,个 体 之 间 的 交互 和 相互 影响 与 演化 促 
成 cF 关 于 菜 类 网 络 热点 事件 的 几 种 主流 观点 产生 ,这 
种 琴 流 群体 观点 的 抽象 概念 化 可 以 认为 是 由 多 个 具有 
相 贺 或 相似 立场 的 个 体 观点 形成 的 团 复 结构 , 即 观点 
团 禾 。 观 点 团 徐 的 演化 则 是 观点 团 徐 的 情感 倾向 、 团 
簇 规模 .传播 范围 等 演化 属性 随 事件 发 展 或 时 间 推移 
所 产生 的 变化 , 当 观 点 团 复 在 后 续 发 展 过 程 中 其 属性 
发 生变 化 则 表明 该 观点 团 簇 内 的 网 民 对 事件 的 态度 发 
生 了 改变 。 对 网 络 与 情 观点 团 篮 演 化 的 感知 有 利于 与 
情 监 管 部 门 对 网 络 僵 情 发 展 情 况 的 把 握 , 及 时 发 现 僵 
情事 件 的 观点 变化 能 够 规避 潜在 与 情 风 险 以 及 消除 与 
情 危机 。 

笔者 基于 LDA (latent dirichlet allocation ) 模型 与 
CNN( convolutional neural networks ) 神经 网 络 构建 网 络 
与 情 观点 团 复 演化 等 级 测度 模型 ,网 络 与 情 观点 团 秘 


度 的 一 种 指标 ,其 演化 等 级 的 高 低 体 现 了 观点 团 复 的 
演化 程度 ,该 指标 能 够 较 好 地 体现 网 络 与 情 随 时 间 维 
度 与 事态 发 展 的 演化 状态 ,包括 网 络 与 情 观 点 团 复 的 
情感 变化 .影响 能 力 、 观 点 体 量 等 信息 ,能够 为 网 络 与 
情 管 控 主 体 针 对 性 的 精准 引导 与 情 风 向 与 管控 与 情 发 
展 提供 参考 依据 。 笔 者 在 理论 层面 明确 观点 团 簇 概念 
与 其 演化 属性 ,在 实践 层面 构建 网 络 与 情 观 点 团 簇 演 
化 等 级 指标 与 其 测度 模型 ,并 利用 “ 翟 天 临 知 网 事件 ” 
作为 研究 实例 ,验证 观点 团 簇 演化 等 级 与 测度 模型 的 
泛 用 性 与 准确 性 。 


2 相关 研究 


2.1 网 络 与 情 观 点 挖 所 

观点 挖掘 主要 是 对 观点 的 情感 倾向 性 与 语义 信息 
进行 提取 ,有 研究 者 利用 K - 最 邻近 分 类 器 与 朴素 贝 
叶 斯 分 类 器 结合 生物 信和 号 检测 的 方法 获取 用 户 的 观 
点 '""。 也 有 学 者 利用 word2vec 将 观点 文本 向 量化 后 输 
入 SVM (Support vector machines ) 与 LSTM ( Long short- 
term memory ) 模 型 中 ,训练 出 能 够 识别 新 观点 的 观点 挖 
掘 模型 ” 。 基 于 深度 学 习 的 观点 挖掘 方法 则 是 目前 研 
究 中 使 用 的 主流 方法 ,有 研究 搭建 带 有 Dropout 机 制 的 
多 层 仍 人 CNN 模型 ,增强 模型 的 局 部 语义 特征 识别 能 


演化 等 级 作为 描述 网 络 与 情 受众 的 群体 性 观点 演化 程 | 力 ,能 较 好 地 挖掘 带 有 某 种 观点 的 文本 ” ,也 有 研究 者 
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通过 结合 词 向 量 与 多 尺度 卷 积 神经 网 络 对 网 络 与 情 观 
点 情感 倾向 进行 分 类 ,将 3 种 尺度 卷 积 单元 融合 为 一 
维 向 量 ,在 实际 观点 挖 气 任 务 中 有 着 良好 的 表现 。 

综 上 所 述 ,在 网 络 与 情 观点 挖 所 的 研究 上 ,研究 者 
主要 利用 各 类 分 类 器 对 网 络 与 情 的 群体 观点 进行 挖 
据 , 但 从 群体 观点 的 属性 状态 角度 分 析 其 随时 间 与 事 
态 发 展 而 产生 变化 的 研究 相对 较 少 ,笔者 结合 语义 角 
度 情感 类 型 ,传播 能 力 等 特征 综合 挖掘 网 络 与 情 的 观 
点 有 利于 从 多 元 角度 分 析 当 前 网 络 与 情 观点 的 演化 状 
态 ,在 该 领域 展开 相关 研究 能 够 为 网 络 与 情 观点 演化 
的 引导 与 管控 提供 实践 上 的 指导 。 
2.2 ”网 络 与 情 观 点 演化 

目前 ,对 于 网 络 与 情 观点 演化 的 研究 主要 从 传播 
的 稍 度 表现 观点 的 演化 情况 。 有 研究 者 从 网 络 与 情 用 
驴 息 及 文本 内 容 视角 出 发 ,构建 不 同 维度 的 网 络 与 
题 图 谱 ,结合 主题 图 谱 对 网 络 与 情 进行 特征 演化 
及 过 视 化 分 析 , 以 表示 网 络 与 情 观点 的 演化 特征 5 ;有 
学 赵 提 出 和 构建 网 络 导 情 衍 进 指数 ,以 文本 聚 类 结 
各 变 本 聚 类 有 效 性 为 依据 ,提出 网 络 与 情 衍 进 的 判别 
栋 碾 ,以 描述 网 络 与 情 发 展 过 程 中 主流 观点 演化 以 及 
新 出 点 产生 的 过 程 '” ;有 研究 基于 社会 网 络 模型 构建 
相 开 节点 之 间 的 连续 观点 交互 模型 ,以 表示 观点 在 伟 
播 过 程 中 的 演化 状态 ; 目前 也 有 研究 基于 传染 病 模 
型 硝 析 网 络 与 情 观点 传播 的 时 间 演化 特征 ,从 而 明确 
网 络 与 情 的 爆发 节点 ,实现 无 监督 预警 。 
入 综 上 所 述 ,目前 国内 外 学 者 对 网 络 与 情 观点 的 演 
化 坚 要 集中 于 利用 社会 网 络 模型 或 传播 模型 对 观点 团 
艇 的 演化 状态 进行 表示 ,并 没有 通过 量化 方式 以 数据 
的 形式 表现 网 络 与 情 热点 事件 中 广大 网 络 与 情 受 众 的 
主流 观点 的 数值 特征 ,网 络 与 情 观点 团 徐 的 演化 量化 
方向 尚 存在 研究 空间 。 


3 ”网 络 熏 情 观点 团 徐 演 化 等 级 测度 模型 
构建 


情况 得 出 观点 团 簇 演化 等 级 ,作为 观点 团 簇 演化 高 峰 
的 研判 依据 。 

观点 团 篮 演化 等 级 测度 的 关键 在 于 观点 团 复 的 划 
分 上 ,首先 需要 确定 网 络 与 情 观 点 的 情感 分 类 ,然后 再 
对 正 负 人 情感 观点 进行 观点 团 簇 划 分 ,这 样 做 的 目的 是 
解决 LDA 划分 观点 团 簇 后 其 中 包含 正 负 情感 观点 数 
量 接近 ,不 能 很 好 地 反映 观点 团 簇 情 感 倾 向 性 的 问题 。 
因此 ,观点 团 复 的 划分 过 程 分 为 3 步 :首先 利用 卷 积 神 
经 网 络 与 情感 词典 相 结合 的 方法 ,对 网 络 与 情 观 点 数 
据 进行 情感 分 类 同时 计算 情感 强度 ,然后 按照 固定 时 
间 窗 对 正 负 情感 语 料 进行 切片 ,笔者 以 天 为 单位 对 网 
络 与 情 数据 进行 切片 ,然后 利用 困惑 度 指标 确定 每 个 
时 间 片 中 正 负 情感 观点 团 簇 的 最 佳 划 分 数量 K, 最 后 
利用 LDA 模型 分 别 对 正 负 情感 语 料 进 行 观 点 团 簇 划 
分 。 

观点 团 复 演化 等 级 测度 模型 的 构建 流程 为 :中 确 
定 观点 极 性 。 划 分 正 向 情感 观点 与 负 向 情感 观点 ,并 
计算 情感 强度 。@) 划 分 观点 团 复 。 利 用 LDA 模型 , 根 
据 困惑 度 指 标 确定 最 佳 观点 团 复 分 类 数 ,划分 正 向 观 
点 团 簇 与 负 向 观点 团 簇 。@ 观 点 团 簇 演化 属性 量化 。 
对 观点 团 复 的 传播 范围 .情感 强度 . 团 复 规模 3 种 演化 
态势 属性 进行 量化 。 由 构建 观点 团 复 演化 链 。 根 据 观 
点 团 自 中 观点 的 文本 语义 相似 度 确 定 前 后 时 刻 观点 团 
簇 的 演化 关系 链条 。 避 观点 团 簇 演化 等 级 计算 ,对 比 
同一 演化 链 中 前 后 时 间 节 点 观点 团 复 的 演化 属性 的 变 
化 情况 ,得 出 观点 团 簇 的 演化 等 级 。 
3.2 ”观点 团 簇 情感 强度 测度 

笔者 利用 卷 积 神经 网 络 (CNN) 对 网 络 与 情 数 据 进 
行情 感 分 类 ,同时 结合 情感 词典 计算 每 条 观点 的 情感 
强度 。CNN 能 极为 准确 地 对 网 络 与 情 观 点 的 情感 进行 
分 类 ,而 情感 词典 方法 则 能 以 数值 体现 情感 的 强度 ,将 
二 者 结合 即 可 得 到 观点 的 情感 强度 。 卷 积 神经 网 络 
( CNN ) 情感 分 类 的 方法 与 CNN 处 理 图 像 的 方式 类 似 ， 
通过 卷 积 层 提取 特征 ,然后 通过 池 化 层 减 少 神经 元 数 


3.1 观点 团 簇 演化 等 级 测度 流程 

笔者 提出 的 观点 团 篮 演化 等 级 测度 的 实现 思路 
为 :首先 对 网 络 与 情 观点 数据 进行 观点 团 篮 划分 ,并 对 
各 个 观点 团 篮 的 情感 强度 ` 团 篮 规 模 与 传播 范围 进行 
量化 ,作为 观点 团 复 的 演化 属性 。 然 后 ,根据 观点 团 禾 
中 关键 词 的 语义 相似 性 构建 观点 团 篮 演化 链 ,以 此 表 
示 某 一 主题 的 观点 团 簇 随时 间 延 续 的 状态 。 最 后 , 根 
据 演 化 链 上 观点 团 簇 演化 属性 在 各 个 时 间 节 点 的 增长 


量 ,最 后 通过 全 连接 层 作 为 分 类 器 输出 概率 。 笔 者 首 
先 根 据 词 频 构建 词 与 频次 的 字典 , 词 频 越 高 的 词 排序 
越 靠 前 ,保留 前 一 万 个 词 以 加 快 训练 速度 。 此 时 已 将 
中 文 词汇 转换 为 模型 可 读 的 数据 类 型 ,然后 利用 卷 积 
层 分 别 以 三 个 词 .四 个 词 .五 个 词 的 移动 步 长 读 取 句 子 
作为 卷 积 核 ,已 经 能 够 完美 地 呈现 句子 的 语义 内 涵 "。 
利用 交叉 炉 函 数 作为 损失 函数 计算 语 料 训练 中 的 损 
失 。 最 后 ,将 多 种 卷 积 核 提 取 的 特征 向 量 展 开 并 连接 
在 一 起 ,并 加 全 连接 层 输 出 类 别 。 根 据 损失 函数 与 准 
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Dz < 让 二 米 f HH 4 一 、 
确 率 的 变化 情况 对 卷 积 神 经 网 络 参 数 进行 调整 , CNN 
模型 参数 如 表 1 所 示 : 

表 1 CNN 模型 参数 
vocab_size = 10 000 保留 频次 前 一 万 的 词 
max_seq_num = 256 每 个 句子 最 多 词 数 量 
num_dimensions = 100 词 向 量 维度 
batch_size = 64 batch 移动 的 步 长 
Filter_sizes =[3,4,5] 三 种 卷 积 核 尺寸 
num filters = 32 卷 积 核 数 目 
num_classes = 2 输出 类 办 
Tterations = 10000 迭代 次 数 
Dropout = 0.5 Dropout 保留 比例 
Leam_rate 学 习 率 为 0.001 
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3t3 观点 团 徐 规 模 测度 

CC 在 观点 团 签 规模 测度 上 ,笔者 选用 LDA 模型 作为 
观 申 团 入 划分 模型 ,LDA 作为 一 种 无 监督 模型 ,虽然 在 
短跑 本 分 类 效果 上 不 如 长 文本 ,但 能 够 较 好 地 应 对 大 
规 笨 网络 生 情 信息 无 法 人 工 标注 类 型 的 问题 ,根据 文 
档 集 中 的 每 篇 文档 按照 概率 分 布 的 形式 给 出 分 类 结 
果 。 网 络 奥 情 观点 团 秘 的 主题 即 可 认为 是 团 禾 内 观点 
共同 的 观点 反应 ,基于 LDA 的 网 络 奥 情 观点 团 入 划分 
的 思想 是 假设 网 络 与 情 观点 本 体 中 的 每 个 词 都 以 一 定 
概率 描述 某 一 观点 团 筷 主 题 ,而 观点 团 徐 主题 是 由 一 
组 特征 词 的 概率 分 布 来 描述 ,不 同 主题 可 能 包含 词汇 
相同 但 属于 团 禾 概 率 不 同 的 特征 词 ,因此 每 类 观点 团 
簇 主题 的 高 频 词 集合 则 可 视 作为 该 类 话题 潜在 语义 的 
体现 9 。 在 得 到 最 终 的 观点 团 秘 主题 概率 分 布 ,迭代 
完成 后 输出 观点 本 体 - 团 徐 主 题 矩 阵 和 团 筷 主题 - 记 
的 概率 矩阵 。 根 据 词 属于 主题 的 概率 将 词 插入 团 艇 主 
题 列 表 中 构成 主题 的 特征 词 集合 即 代表 观点 主体 对 微 
博 事件 的 观点 的 表述 。 


在 确定 模型 参数 后 ,情感 分 类 损失 与 准确 率 见 图 
1] 。 


从 图 1 可 以 看 出 ,CNN 模型 在 使 用 表 1 参数 后 的 
损失 函数 在 3 万 次 循环 后 已 经 收敛 , 且 分 类 准确 率 达 
到 了 较 高 的 水 平 。 

在 微 博 与 情 观 点 情感 强度 确认 后 ,利用 BosonNLP 
情感 词典 "” ,结合 停 用 词 .否定 词 程度 副词 词典 的 方 
式 对 微 博 舆 情 观点 文本 内 容 进行 情感 强度 计算 ,利用 
python 的 jieba 分 词 包 对 测试 集 语 料 进行 分 词 ,并 去 停 
用 词 ,将 切 分 的 词 与 情感 词典 进行 匹配 ,最 后 得 出 含有 
分 数 的 情感 值 。 
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1 CNN 模型 测试 集 与 训练 集 损失 变化 


响 观点 团 复 划分 的 精确 与 否 , 利 用 LDA 模型 进行 观点 
团 复 划分 的 一 个 问题 是 单位 时 间 内 观点 团 复 数量 K 的 
值 , 即 语料库 的 最 优 分 类 数 确 定 问题 ,因此 利用 LDA 
主题 模型 分 类 需要 确定 分 类 个 数 , 笔 者 采用 较为 通用 
的 困惑 度 指标 (Perplexity ) 确定 每 个 时 间 段 中 的 最 佳 观 
点 团 簇 个 数 ,以 此 来 体现 分 类 的 可 信和 度 。 困 惑 度 用 于 
度量 概率 分 布 或 概率 模型 预测 样本 的 好 坏 程度 ,通过 
对 比 两 个 概率 分 布 或 概率 模型 在 预测 样本 上 的 优 劣 来 
选取 最 优 模型 ,困惑 度 在 评价 聚 类 分 类 算法 的 性 能 
有 极 好 的 效果 ,因此 可 以 通过 对 比 困 惑 度 来 选取 LDA 
的 最 优 观点 团 复数 。 困 惑 度 针对 不 同 模型 从 概率 分 布 
困惑 度 .概率 模型 困惑 度 以 及 分 词 困 惑 度 3 种 方法 计 
算 困 惑 度 ,针对 自然 语言 处 理 模型 通常 选用 Perplexity 
per word, 即 分 词 困惑 度 方 法 进行 困惑 度 计 算 … 。 在 
测试 集 Dt 上 ,困惑 度 表 达 式 如 公式 (1) 所 示 : 

也 log p(w,lM) 
Perlexity( D,) = op 加 


t=] 
其 中 ,M 是 指 训练 好 的 模型 参数 ,在 LDA 模型 中 
为 theta 和 phi, 即 观点 - 观点 团 复 矩阵 与 观点 - 特征 


2K) 


d 
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词 词 矩 阵 ,N, 为 观点 d 中 单词 数量 ,ws 为 测试 集 D, 中 
观点 d 的 词 向 量 形式 。 由 公式 (1) 可 知 ,中 括号 内 分 子 
项 为 测试 集中 微 博 d 属于 模型 上 的 概率 ,其 值 越 大 代 
表 困 惑 度 越 小 ,说 明 模型 性 能 越 高 。 

在 对 观点 团 篮 最 佳 团 复 数量 求解 时 需要 自动 识别 
最 佳 观 点 团 艇 数量, 但 离散 点 组 成 的 曲线 无 法 直接 提 


取 最 佳 团 艇 数量, 因此 笔者 采用 曲线 拟 合 的 方式 ,将 离 
散 点 组 成 的 函数 拟 合成 为 连续 函数 并 求 其 二 阶 导数 ， 
利用 函数 曲线 二 阶 导 数 为 零 则 为 函数 拐点 的 性 质 , 对 
困惑 度 拟 合 曲线 第 一 个 最 低 点 作为 网 络 与 情 观 点 团 复 
规模 划分 的 最 佳 数 目 。 网 络 与 情 观 点 团 徐 困惑 度 曲线 
与 拟 合 曲线 如 图 2 所 示 : 


一 一 拟 合 函数 
一 一 原 函 数 
@ 抛 点 


= 
~ 0 bs 10 15 20 pa 30 
CO 点 团 入 数量 

所 2 ”网 络 舆 情 观点 团 艇 困惑 度 曲线 与 拟 合 曲线 示意 图 


忆 在 确定 好 每 个 时 间 切片 中 网 络 和 与 情 观点 的 最 佳 观 
点 转 秘 数量 后 ,利用 LDA 对 每 个 时 间 段 内 的 正 负 情 感 
观 起 进行 观点 团 侯 划分 ,同时 可 以 得 到 观点 团 篮 的 规 
机 属性 数据 。 

3@9 观点 团 簇 传播 范围 测度 

ON 传播 范围 的 计算 思路 为 :分 别 计算 观点 团 秘 的 用 
户 著 播 能 力 与 观点 传播 能 力 ,然后 将 用 户 传播 能 力 与 
观点 传播 能 力 结合 得 到 观点 团 徐 的 传播 范围 。 用 户 传 
播 饲 力 以 网 络 与 情 用 户 的 账号 互动 属性 即 该 用 户 的 关 
注 娄 量 粉丝 数量 、 微 博 数 量 的 总 量 表 示 , 各 指标 取 值 
与 千 权 重 和 该 用 户 的 认证 系数 相 结 合 即 得 到 用 户 传播 
能 力 , 在 计算 观点 团 徐 内 各 个 用 户 传播 能 力 后 即 得 到 
观点 团 簇 的 用 户 传播 能 力 ,因此 观点 团 簇 用 户 传播 能 
力 Ci 的 计算 如 公式 (2) 所 示 : 


N 
Cuw = index,, 2 NeW ss + NW + TW 


wer 公式 (2) 
其 中 ,index。 为 观点 团 复 内 用 户 的 认证 系数 ,N 为 
观点 团 艇 内 用 户 数 量 ,n, .ns ,ns 分 别 为 观点 团 篮 内 用 


Cinion = index,,, Sn + nw + Nw, 公式 (3) 
其 中 ,index. 为 观点 团 簇 内 观点 数据 类 型 加 成 ,M 
为 观点 团 簇 内 观点 数量 ,ny ng nw 分 别 为 观点 团 簇 内 
观点 评论 数量 、 观 点 团 簇 内 观点 点 上 赞 数量、 观点 团 簇 内 
观点 转发 数量 ,wu ww wx 分 别 为 各 指标 权重 。 
网 络 与 情 观点 团 簇 的 传播 能 力 则 是 由 观点 团 入 用 
户 信 息 量 与 网 络 与 情 观 点 信息 量 相 加 得 出 。 网 络 与 情 
观点 团 簇 信息 量 Co 的 计算 如 公式 (4) 所 示 : 
Ce = Cisor + Copinion 
3.5 观点 团 簇 演 化 链 构建 
根据 观点 动力 学 理论 ,个 体 的 观点 形成 受 其 他 个 
体 观 点 的 影响 , 且 其 观点 情感 倾向 于 个 体 所 认同 的 观 
点 。 观 点 团 禾 演 化 链 可 以 认为 在 时 间 维度 上 ,后 续 
时 间 节 点 的 观点 团 簇 是 受到 前 序 节 点 观点 团 簇 影响 所 
产生 的 ,二 者 在 语义 内 涵 上 具有 较 高 的 一 致 性 ,因此 当 
前 后 时 间 点 上 的 两 个 观点 团 复 具有 最 高 的 语义 相似 度 
时 , 则 可 以 认为 二 者 在 时 间 维 度 上 是 演化 关系 ,后 一 时 


公式 (4) 


户 关注 数量 、 观 点 团 靠 内 用 户 粉 丝 数 量 、 观 点 团 簇 内 用 
户 博 文 数量 ,w,, wi Wi, 为 指标 权重 。 

观点 传播 能 力 与 用 户 传播 能 力 计算 相同 ,以 网 络 
与 情 观点 的 互动 属性 即 该 观点 获得 的 点 疯 数量 转发 
数量 .评论 数量 的 总 量 表示 观点 传播 能 力 ,结合 其 指标 
权重 与 观点 的 数据 类 型 系数 求 出 网 络 舆 情 观 点 的 传播 
能 力 ,观点 团 徐 的 观点 传播 能 力 即 为 各 观点 累加 求 得 ， 
因此 网 络 熏 情 观点 团 簇 的 观点 传播 能 力 C,, 的 计算 
如 公式 (3) 所 示 : 


间 节 点 的 观点 团 篮 是 前 一 时 间 节 点 观点 团 复 在 时 间 维 
度 上 的 延续 。 观 点 团 簇 演化 链 构建 流程 见 图 3。 
笔者 利用 Textrank 算法 将 观点 团 篮 文 本 内 容 的 分 
词 进行 排序 ,选取 前 500 个 词 作 为 相似 度 对 比 依据 ,再 
利用 TFIDF 方法 计算 前 后 时 间 节 点 语料库 中 词 的 
TFIDF 值 ,将 TFIDF 值 与 观点 团 复 类别 构 成 观点 团 篮 
的 向 量 和 矩阵 ,通过 余弦 值 相似 度 方 法 将 两 个 时 间 节 点 
中 的 观点 团 徐 进 行 两 两 比较 ,利用 余弦 值 相 似 度 方法 
进行 比 对 ,能够 得 到 前 后 两 个 时 间 节 点 的 观点 团 复 相 
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输 输 输 输 
时 间 T 的 观点 团 徐 入 出 时 间 T 的 观点 团 簇 内 出 
文本 内 容 集合 关键 词 集合 相似 度 矩 阵 
人 TFIDF 
2 | 
排序 
时 间 T+1 的 观点 团 簇 时 间 T+1 的 观点 团 簇 观点 团 簇 
文本 内 容 集合 关键 词 集合 演化 链 


3 观点 团 复 演化 链 构建 流程 


似 度 矩阵 ,矩阵 中 数值 表示 后 一 时 间 节点 中 每 个 观点 
团 秘 与 前 一 时 间 节点 中 每 个 观点 团 篮 的 语义 相似 度 ， 
通过 提取 相似 度 最 高 的 两 个 观点 团 秘 进行 观点 团 艇 演 
化 链 的 构建 。 该 方法 能 消除 大 量 无 用 词 对 观点 团 簇 语 
义 相似 度 对 比 的 干扰 ,同时 对 排名 靠 前 的 词 进 行 相似 
度 比 对 也 更 能 体现 观点 团 秘 彼 此 之 间 的 关联 性 。 

一 首先 需要 将 每 个 观点 团 徐 中 的 网 络 与 情 观点 进行 
售 治 ,将 整合 后 的 语 料 作 为 网 络 与 情 观点 团 秘 文 本 内 
铭 章 每 类 观点 团 能 以 一 个 长 文本 表示 ,该 长 文本 是 该 
观 证 团 从 内 所 有 网 络 与 情 观点 汇总 。 某 个 事件 的 生命 
后 其 为 了 天 , 则 T= 11,2,3，…,t ,时 间 节点 第 1 天 中 
全 六 个 网 络 与 情 观点 团 比 , 对 观点 团 秘 文本 进行 分 
启动 得 到 第 " 个 观点 团 算 的 关键 词语 料 集合 为 W, = 
[ww sw ,前 一 时 间 节点 第 Fl 天 中 含有 
他 网 络 与 情 观 点 团 禾 , 第 m 个 观点 团 秘 的 关键 词语 料 
集合 为 W。 = | wi ,wi ,ws,…,w| ,利用 Textrank 算法 对 
所 奉 观 点 团 马 关键 词语 料 进行 重新 排序 ,并 选取 前 
500E 个 词 , 如 果 语 料 中 不 足 500 词 则 用 空格 填充 。 利 用 
THEDF 方法 计算 前 后 时 间 节 点 中 每 个 观点 团 簇 语料库 
中 油 在 该 语料库 中 的 TFIDF 值 。 

“TFIDF 值 可 以 表征 一 个 词 对 语料库 中 其 中 一 份 文 
档 的 重要 程度 , 词 的 重要 性 随 着 其 在 文档 中 出 现 次 数 
而 增加 ,但 同时 会 随 着 其 在 语料库 中 出 现 频率 增加 而 
降低 。 在 本 文中 经 过 排序 后 的 观点 团 复 关 键 词 的 
TFIDF 值 将 作为 观点 团 簇 的 向 量 表示 。TFIDF 值 为 TF 
值 与 IDF 值 的 乘积 , 词 频 (term frequency ,TF ) 指 某 一 词 
在 该 文档 中 出 现 的 次 数 , 通 常 对 该 值 进行 归 一 化 处 理 
以 防止 长 文本 干扰 。 

TFIDF 值 体现 了 词 代表 某 一 观点 团 篮 语 义 内 容 的 
要 程度 ,每 个 观点 团 艇 选取 最 能 代表 团 徐 内 涵 的 前 
00 个 关键 词 并 计算 器 TFIDF 值 ,将 时 间 节 点 t 中 各 个 
网 点 团 能 与 其 所 含 关键 词 的 TFIDF 值 关联 构成 了 该 时 
问 节 点 的 观点 团 艇 向 量 ,向 量 中 每 个 值 表示 观点 团 艇 


[hadll 


LAn 


Na 


个 观点 团 禾 之 间 的 相似 度 。 观 点 团 篮 的 余弦 值 相似 度 
计算 如 公式 (5) 所 示 : 


SC Xi) 


MC) XA 2 
其 中 ,k 为 向 量 维 数 ,x \y 为 前 一 时 间 节点 与 后 一 
时 间 节点 第 i 维 向 量 值 ,余弦 值 数值 越 接近 1 则 说 明 
两 个 观点 团 秘 向 量 余弦 夹 角 越 小 , 则 相似 度 越 高 。 将 
前 后 两 个 时 间 节 点 的 向 量 进行 相似 度 计算 后 可 以 得 到 
n xm 维 的 相似 度 答 阵 ,如 公式 (6) 所 示 : 


公式 (5) 


COS similar 


SI S12 51 
S21 2 外 
Matrix,s,i, = 公式 (6) 
Sl Sm Sn 


其 中 ,n 为 后 一 时 间 节 点 中 观点 团 簇 数量 ,m 为 前 
一 时 间 节 点 中 观点 团 复数 量 , 在 矩阵 中 列表 示 后 一 天 
第 n 类 观点 团 复 与 前 一 天 所 有 观点 团 徐 的 相似 度 值 ， 
和 矩阵 中 每 列 的 最 大 值 的 行 数 即 表 示 后 一 时 间 节 点 观点 
团 复 是 前 一 时 间 节 点 中 某 个 观点 团 复 的 演化 。 将 事件 
中 所 有 时 间 节 点 进行 观点 团 篮 相似 度 对 比 后 即 可 构建 
观点 团 复 的 演化 链 ,并 根据 观点 团 复 的 演化 链 提取 该 
演化 链 中 观点 团 簇 的 演化 态势 属性 。 根 据 现实 情况 来 
看 ,前 一 天 的 观点 团 簇 会 存在 多 个 演化 链 的 情况 , 即 后 
续 时 间 节 点 中 多 个 观点 团 簇 都 是 受到 前 一 团 簇 的 影响 
形成 的 ,因此 利用 相似 度 矩 阵 构建 演化 链 时 会 存在 后 
一 时 间 节 点 的 多 个 观点 团 篮 与 前 一 时 间 节 点 中 某 个 观 
点 团 修 相似 度 皆 最 大 的 情况 ,属于 演化 中 的 分 裂 现象 。 
3.6 ”观点 团 禾 的 演化 等 级 构建 

在 构建 观点 团 簇 演 化 链 之 后 , 便 可 对 观点 团 簇 演 
化 链 上 的 观点 团 簇 演化 属性 分 值 进行 计算 。 通 过 对 已 
有 事件 的 观点 团 簇 演化 情况 进行 分 析 得 知 , 传 播 范 围 、 
情感 强度 以 及 团 复 规模 在 增幅 小 于 100% 时 ,其 观点 
团 簇 内涵、 观点 状态 等 属性 基本 无 变化 ,因此 其 演化 性 


中 关键 词 的 TFIDF 值 ,500 个 词 则 表示 向 量 共 500 维 ， 
将 观点 团 禾 向 量化 后 便 可 根据 余弦 相似 度 算法 计算 两 


较 低 ;而 增幅 在 100% 至 200% 之 间 时 ,前 后 观点 团 簇 
具有 较为 明显 的 演化 ,演化 性 凸现 ;而 当 增 幅 大 于 
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200% 时 观点 团 簇 的 演化 性 极 高 ,其 多 数 观点 内 涵 发 9 
了 变化 “。 笔 者 对 观点 团 簇 演化 属性 分 值 用 分 段 函 


Er 


表 2 网 络 与 情 观 点 团 簇 演化 等 级 分 型 


演化 等 级 演化 属性 分 数 网 络 与 情 观点 团 能 
数 表示 ,观点 团 徐 的 传播 范围 情感 强度 以 及 团 艇 规模 传播 范围 情感 强度 ” 团 秘 规模 演化 状态 表征 
的 分 值 计算 如 下 : 1 级 3 3 3 观点 团 秘 传 播 范围 .情感 强 
by 2 级 8 3 度 、 团 徐 规 模 等 方面 全 面 演 
传播 范围 演化 属性 分 数 Le, 如 公式 (7 ) 所 示 : 5 化 ,影响 范围 极 广 , 极 易 形 
pa 3 级 . 9 2 成 网 络 奥 情 危机 ,其 演化 态 
1 if (0= 7 一 <1) 4 级 2 3 3 势 等 级 属于 最 高 级 别 
C 5 级 3 2 2 观点 团 修 的 传播 范围 ,情感 
C _C 2 强度 与 团 徐 规 模 增 长 适中 ， 
Loe=12 引 (L< 一 <2) 公式 (7) ， 表明 有 部 分 的 具有 极 强 影 
3 响 力 的 观点 在 较 广 的 范 了 
3 C.-C 1 3 3 传播 ,存在 成 为 与 情 危 机 的 
人 潜在 风险 
C，， 7 级 2 3 的 
其 中 ,C, 是 演化 链 上 时 间 节 点 t 的 观点 团 复 传播 ， 。 ” ! 
8 2 2 2 
菏 于 兆 县 育 [H 闻 切 占 占 Ai- 
范围 数值 ,C,_, 是 前 一 时 间 证 点 t-1 上 观点 团 簇 传播 5 3 1 有 
范围 数值 。 j 度 与 团 徐 规模 增长 幅度 较 
、 nM 2 小 ,表明 观点 团 篮 处 于 较为 
情感 强度 演化 属性 分 数 Ls, 的 计算 如 公式 (8) 所 示 : 10 级 2 1 3 活跃 的 演化 状态 ,需要 加 强 
© 。 S, 一 人 1 ! 2 3 后 续 观察 
SF 1 if (0=<- CA 11 级 2 3 1 
© 1 3 2 
S 一 4 
© se) 公式 (8) | ng 3 | 9 
< 人 1 1 3 
S = 
区 3 Ys ) ! 3 1 
GAN 13 级 安 1 2 观点 团 复 的 传播 范围 .情感 
其 中 ,S, 是 演化 链 上 时 间 节 点 +t 的 观点 团 艇 情感 2 2 1 强度 与 团 比 规模 变动 幅度 
i ee a 有 限 ,属于 观点 团 秘 演 化 中 
绰 记 数值 ,S，, 是 前 一 时 间 节 点 t-1 上 观点 团 徐 情感 E 2 的 阶段 性 波动 
强 着 数值 14 级 2 1 1 
\ i 区 ' 1 2 
< 团 纪 规模 演化 属性 分 数 Lo, 的 计算 如 公式 (9) 所 , ， 
不 她 1 1 1 
日 Be 0 一 O 
a I 
性 ps 4 ”实证 研究 
L, =42 i (< 一 下 <2) 公式 (9 re a 
=]2 (< 0 “2) 公式 (9) | 4.1 数据 源 选择 与 采集 
3 洲 pm 一 0 为 验证 网 络 与 情 观 点 团 簇 演化 等 级 的 适用 性 , 笔 
L SR 
O，， 


其 中 ,0, 是 演化 链 上 时 间 节 点 的 观点 团 篮 规模 数 
值 ,0,_1 是 前 一 时 间 节 点 t-1 上 观点 团 簇 规模 数值 。 

笔者 将 网 络 和 与 情 观 点 团 簇 的 演化 等 级 分 为 14 个 
等 级 ,每 个 级 别 根 据 观点 团 簇 的 传播 范围 情感 强度 、 
团 簇 规模 3 个 演化 属性 分 数 进行 进一步 划分 ,观点 
篮 演 化 属性 分 数 Le,、Ls,、Lo, 的 取 值 分 别 通过 公式 
(7) 公式 (8) 公式 (9 ) 计 算得 出 ,计算 观点 团 篮 演化 
链 上 每 个 时 间 节 点 与 后 一 时 间 节 点 上 观点 团 簇 演化 属 
性 分 数 ,并 与 观点 团 簇 演化 等 级 分 型 表 进 行 匹配 ,得 到 
观点 团 篮 的 演化 等 级 。 网 络 与 情 观 点 团 篮 演 化 等 级 分 
型 如 表 2 所 示 : 


者 以 “ 翟 天 临 知 网 事件 ”作为 实证 对 象 。 在 该 事件 中 ， 
第 一 次 热度 达到 峰值 是 由 于 教育 部 出 面 回 应 该 事件 并 
展开 调查 ,而 第 二 次 热度 上 升 则 是 北京 电影 学 院 发 布 
调查 结果 并 取消 翟 天 临 博士 学 位 ,随后 热度 持续 走低 
进入 蔓延 期 。 该 事件 的 两 次 热度 高 潮 都 是 由 于 事态 出 
现 转折 ,官方 出 面 回 应 将 事件 热度 拉 向 顶峰 。 而 网 友 
对 于 该 事件 的 讨论 多 集中 在 对 翠 天 临 博士 论文 涉嫌 抄 
袭 北京 电影 学 院 的 调查 结果 以 及 教育 部 回应 等 方面 。 
2 月 9 日 至 2 月 15 日 “ 翟 天 临 知 网 事件 "关键 时 间 节 
点 见 图 4。 

利用 扑 虫 工具 以 “ 翟 天 临 ”为 关键 字 从 微 博 平台 
中 抓 取 时 间 跨 度 为 2019 年 2 月 9 日 至 2019 年 4 月 9 日 
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2 月 9 日 ， 梁 天 临 知 网 


事件 在 网 络 中 开始 
发 酵 
2 月 15 日 ， 
2 月 11 日 ,北京 电影 教育 部 回应 
2 月 8 日 晚 ， 学 院 成 立 调查 组 并 要 求 有 关 方 
影视 学 员 翟 天 临 在 按照 相关 程序 启动 面 迅 速 进行 
直播 过 程 有 网 友 问 调查 。 北 大 光华 学 核查 
道 能 否 在 知 网 中 检 院 发 声明 将 根据 其 2 月 14 日 ， 
索 到 其 论文 ， 翟 天 博士 学 位 授予 单位 翟 天 临 
临 回 应 称 “ 不 知道 的 调查 结论 做 出 被 迫 道 歉 
知 网 是 什么 ” 处 理 
2-8 2-9 2-10 机 oe 2-13 2-14 2-15 


日 期 


图 4 2 月 9 日 至 2 月 15 日 " 翟 天 临 知 网 事件 "关键 时 间 市 点 


的 相关 网 络 和 与 情 数 据 并 进行 数据 清洗 ,包括 去 除 纯 表 
情 或 符号 博文 .利用 正则 表达 式 消除 相同 样式 前 级 与 


有 效 数据 ,“ 翟 天 临 知 网 事件 ”的 观点 数 
关系 如 图 5 所 示 : 


后 


随时 间 变 化 


es es 
后 缀 .去 除 同一 博 主 重复 发 文 等 ,得 到 共计 27 433 条 
ee 6000 
© 4 878 
SF 5 000 4590 
© < 4m 
OO 电 
9 党 3000 
< 
© 2 000 
CD 1000 519 
© . 
ES 
CN 人 II 人 Sa 
= 站 
> “ 翟 天 临 知 网 事件 ”时 间 轴 /天 
日 Bs 
图 5 “ 翟 天 临 知 网 事件 "观点 数量 随时 间 变化 关系 


. 太 从 图 5 中 可 以 看 出 ,“ 翟 天 临 知 网 事件 ”中 的 微 博 


表 3 2 月 9 日 正 向 观点 团 簇 演化 属性 数值 与 语义 内 涵 


鳃 簿 观点 数量 在 2 月 12 日 与 2 月 15 达到 高 峰 ,随后 厂 包 。 传播 。” 情感 团 入 a 
a 类 别 四 强度 ”规模 机 
快 是 下 降 , 观 点 数量 变化 趋势 与 事件 热度 发 展 趋势 基 | 关东 = a 
加 本 二 洒 访 1 1 254 190 16 大 量 明 星 参 加 新 年 晚会 活动 
本 相同 ,表明 抓 取 的 数据 能 很 好 地 描述 该 事件 发 展 情 | ， Da 。 4 加。 新 作 各 ( 厂 生 之 半 ) 入 一 
况 。 的 期 竺 
4.2 数据 处 理 与 分 析 3 4069 201 17 ”关于 美食 的 做 法 与 功效 
i 、 4 22475 205 18 ” 翟 天 临 学 术 问 题 的 报道 
(1) 观 点 团 复 演化 属性 测度 。 首 先 需要 根据 该 事 ee 
5 3 120 129 17 ， 翟 天 临 论文 查 重 问题 的 报道 
件 中 观点 的 情感 强度 将 事件 微 博 数据 划分 为 正 向 情感 | 。 on Ri 抽 
观点 与 负 向 情感 观点 ,经 过 情感 分 类 后 得 到 正 向 情感 7 1 680 139 19 ”旅行 与 文艺 类 观点 


观点 5 153 个 , 负 向 情感 观点 22 280 个 ,可 见 在 该 事件 
中 ,对 于 演员 翟 天 临 的 博士 论文 抄袭 广大 网 络 与 情 用 
户 是 持 有 负面 情感 。 随 后 计算 观点 团 簇 的 演化 属性 数 
值 ,由 于 事件 跨越 周期 较 长 ,因此 笔者 选取 事件 开始 日 
期 2 月 9 日 与 最 后 一 次 热度 高 峰 2 月 15 日 这 两 个 关 
键 时 间 节 点 展示 网 络 奥 情 观点 团 簇 的 演化 属性 测度 数 
据 ,2 月 9 日“ 翟 天 临 知 网 事件 ”正人 负 向 网 络 和 与 情 观 点 
团 复 属性 信息 如 表 3、 表 4 所 示 : 


由 表 2 与 表 3 中 可 知 ,在 2 月 9 日 正 负 网 络 与 情 
观点 团 复 数量 缘 为 7, 由 于 事件 正 处 于 发 酵 前 期 ,部 分 
网 友 以 及 翟 天 临 粉丝 并 不 知晓 翟 天 临 事件 的 发 生 ， 
此 存在 儿 类 观点 团 簇 是 对 翟 天 临 作品 期 待 、 对 其 演技 
认可 或 其 参加 活动 的 内 容 , 也 存在 部 分 观点 团 簇 是 发 
表 在 翟 天 临 超 话 板块 的 广告 类 内 容 ,考虑 到 该 部 分 “ 噪 
音 " 同 样 具有 传播 影响 能 力 , 故 本 文子 以 保留 。 正 向 观 
点 团 簇 的 各 项 属性 数值 皆 较 低 , 观 点 团 秘 规 模 普遍 较 
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表 4 2 月 9 日 负 向 观点 团 复 演 化 属性 数值 与 语义 内 酒 
团 马 传播。 情感 团 仍 


语文 内涵 
类 别 范围。 强度 规模 Eee 
1 104 649 一 227 63 ” 翟 天 临 人 设 骨 塌 , 学 术 造 假 
2 766 095 —328 61 ”对 翟 天 临 的 讽刺 ,要 求 其 做 出 回应 
3 34 876 一 197 54 ”对 翟 天 临 演技 的 认可 但 对 其 行为 的 
批判 
4 893 032 -319 59 ”批判 稚 天 临 名 不 副 实 ,与 博士 学 霸 人 
设 不 符 


5 1015614 -306 48 ”批判 积 天 临 工作 室 意图 降低 事件 热 搜 


6 415996 一 225 46 ”和 希望 翟 天 临 的 学 校 给 出 回应 
7 5 589 一 198 55 。 借 翟 天 临 事件 对 真正 学 术 研 究 的 冰 述 


小 。 而 负面 观点 团 秘 的 属性 数值 则 较 大 ,最 为 明显 的 
为 负 向 第 五 类 观点 团 秘 , 该 团 徐 传 播 范围 最 大 但 团 入 
规模 较 小 ,表明 此 时 已 经 有 较 多 观点 领袖 参与 事件 讨 
论 着 提 出 负 向 观点 ,而 根据 语义 内 涵 可 知 此 时 已 有 观 
点 团 秘 指向 翟 天 临 学 术 论文 抄袭 、 帘 天 临 演技 尚 可 但 

C 夭 希望 翟 天 临 给 出 解释 等 方面 。 

@ 〇 在 ?月 15 日 , 誉 天 临 知 网 事件 热度 达到 顶峰 ,该 
时 邮 节 点 的 正 负 向 观点 团 簇 属性 信息 如 表 5、 表 6 所 


SU 
这 
和 @5 2 月 15 日 负 向 观点 团 簇 演化 属性 数值 与 语义 内 涵 


DN | 
| 


传播 情感 团 禾 
, a 语义 内 涵 
类 别 。 范围 。 ”强度 。 规模 
LE 44 349 2132 ”201 ”生活 文艺 类 观点 
2 200248 ”2350 ”166 影视 作品 类 观点 


志 687 440 1 862 159 ”女性 护肤 品 与 化 妆 品 广告 类 观点 
A 1480039 2186 ”157 建筑 .旅游 类 观点 


Fen 121 450 2 216 141 ”减肥 与 减肥 食品 类 观点 


52 813 1999 ”161 家居 装修 类 观点 
(©® 


表 6 2 月 15 日 负 向 观点 团 簇 演化 属性 数值 与 语义 内 酒 
团 科 ”传播 。” ”情感 团 艇 


类 别 。 范围 。 强度 。 规模 Wd 
1 1803361 -4090 700 网 友 批 判 娱乐 圈 教 育 问题 
2 1007101 -2802 561 ”对 学 术 腐败 问题 的 讨论 
3 5408158 -3398 534 ”北大 与 北 电 发 表 声明 要 彻 查 翟 天 临 
学 术 问 题 
4 8011850 -6552 941 网 友 对 学 术 公 平 性 的 讨论 
5 40682983 -7289 684 ”教育 部 回应 翟 天 临 事 件 的 相关 内 容 


由 表 4 与 表 5 可 以 得 知 , 在 舆论 热度 达到 顶峰 时 
各 类 观点 团 篮 的 演化 属性 数值 极 高 , 团 复 规模 与 信息 
量 等 属性 的 数值 较 事 件 开始 日 期 2 月 9 日 增长 数 十 
音 , 表 明 此 时 该 事件 已 经 得 到 了 广泛 关注 ,通过 观点 团 
徐 关 键 词 总 结 的 观点 团 簇 语义 内 涵 可 以 看 出 ,此 时 正 
向 观点 团 簇 已 经 几乎 没有 微 博 与 情 用 户 为 翟 天 临 进 行 
辩解 , 正 向 观点 多 是 发 布 在 各 类 改天 临 超 话 或 话题 等 


板块 的 广告 类 微 博 。 而 此 时 负 向 观点 团 复 数量 较 少 ， 
表明 此 时 微 博 与 情 用 户 关注 点 高 度 集中 , 主要 对 翟 天 
临 抄袭 为 娱乐 圈 与 学 术 圈 禹 来 的 影响 学术 腐败 问题 
以 及 官方 发 表 声 明 与 表态 等 内 容 进行 讨论 。 对 比 两 个 
关键 时 间 节 点 中 观点 团 禾 的 属性 与 团 复 中 观点 内 涵 可 
以 看 出 ,“ 翟 天 临 知 网 事件 ”中 观点 团 簇 的 情感 强度 、 
传播 范围 与 团 簇 规模 都 发 生 了 极为 明显 的 演化 ,并 且 
负 向 观点 团 篮 的 语义 内 涵 也 从 针对 事件 本 身 的 讨论 演 
化 为 该 事件 对 社会 秩序 造成 的 影响 。 

(2) 观 点 团 复 演化 链 构建 。 在 对 该 事件 的 网 络 与 
情 观 点 团 簇 演化 属性 进行 测度 之 后 , 便 可 构建 其 观点 
团 簇 演化 链 , 将 前 后 两 个 时 间 节 点 中 各 个 观点 团 簇 进 
行 交 义 对 比 ,将 关键 词 相 似 度 最 高 的 前 后 两 个 时 间 节 
点 中 观点 团 簇 关联 起 来 便 构成 了 观点 团 簇 演化 链 。 由 
于 抓 取 的 事件 数据 跨度 时 间 较 长 ,难以 将 全 部 网 络 与 
情 观 点 的 演化 链 进行 展示 ,因此 在 下 文中 以 2 月 9 日 
至 2 月 15 日 的 观点 团 簇 数据 展示 其 演化 状态 ,经 过 网 
络 和 与 情 观 点 团 簇 演化 链 构建 得 到 正 向 观点 团 簇 演化 链 
23 条 , 负 向 观点 团 禾 演化 链 22 条 。 由 于 演化 链 较 多 ， 
因此 本 次 实验 分 别 选 取 一 条 正 向 演化 链 与 一 条 负 向 演 
化 链 的 演化 情况 进行 实证 结果 展示 。 正 向 观点 团 簇 演 
化 链 与 负 向 观点 团 篮 演化 链 在 2 月 9 日 与 2 月 15 日 
上 前 10 个 关键 词 变 化 对 比如 表 7 所 示 : 

表 7 2 月 9 日 与 2 月 15 日 演化 链 前 10 个 关键 词 

演化 链 极 性 2 月 9 日 2 月 15 晶 


正 向 演化 链 ”童年 ,人 生 , 幼稚, 心灵, 奶 童年, 人生, 孩子 ,父母 , 母 
奶 ,天 真 ,烂漫 ,儿童 ,快乐 ， 亲 , 快 乐 ,生活 ,欢笑 ,幸福 ， 


负 向 演化 链 翟 天 临 ,事件 ,演员 ,学 术 ， 
纱 袭 ,北京 大 学 ,博士 学 位 ， 
论文 ,不 端 ,造假 

从 表 6 可 以 看 出 ,无 论 正 向 还 是 负 向 的 演化 链 在 
这 段 时 间 内 关键 词语 义 内 涵 基 本 保持 一 致 ,表明 这 两 
条 演化 链 都 是 各 自 种 观点 在 时 间 上 的 延续 ,通过 对 演 
化 链 上 观点 团 篮 的 演化 属性 数值 进行 对 比 , 即 可 得 到 
观点 团 簇 的 演化 等 级 ,如 果 数 值 增 量 较 大 则 表明 该 演 
化 链 所 代表 的 观点 发 生 了 明显 的 演化 现象 。 通 过 测度 
后 的 正 向 观点 团 篮 演 化 链 与 负 向 观点 团 篮 演化 链 的 演 
化 属性 与 演化 等 级 见 表 8 与 表 9。 

表 6 与 表 7 中 团 篮 类别 表示 该 演化 链 在 每 个 时 间 
段 上 由 茶 个 类 别 的 观点 团 复 构成 ,该 演化 链 中 的 观点 
团 复 都 表示 同一 种 观点 主题 ,从 10 日 开始 后 的 观点 团 
复 都 是 9 日 起 始 观点 团 复 的 延续 ,0 则 表示 该 演化 链 
没有 后 续 演 化 ,同时 该 演化 链 的 演化 属性 也 固定 在 某 


告 天 临 ,事件 ,演员 ,学 术 ， 
抄袭 造假 ,论文 ,北大 , 博 
士 , 北 电 
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表 8 正 向 观点 团 禾 演化 链 的 演化 属性 与 演化 等 级 


日 期 团 复 类 别 ”传播 范围 ”情感 强度 。 团 簇 规模 ”演化 等 级 
2 月 9 日 了 1 680 139 19 14 级 
2 月 10 日 1 2 026 172 22 14 级 
2 月 11 日 6 40 936 402 37 8 级 
2 月 12 日 5 183 989 2 451 191 4 级 
2 月 13 日 0 183 939 2 451 191 14 级 
2 月 14 日 0 183 939 2 451 191 14 级 
2 月 15 日 0 183 939 2 451 191 14 级 


负 向 观点 团 簇 演 化 链 的 演化 属性 与 演化 等 级 
团 


簇 类 别 ”传播 范围 ”情感 强度 团 艇 规模 ”演化 等 级 
4 893 032 -318 60 14 级 
3 1 211 353 -761 124 14 级 
5 15 539 456 -1 945 240 9 级 
5 36 377 192 -9617 819 6 级 
3 37 879 618 。” -11 593 1 034 14 级 
0 37 879 618 。” -11 593 1 034 14 级 
0 37 879 618 。” -11 593 1 034 14 级 


< 矣 值 上 ,3 种 演化 属性 的 数值 则 为 该 演化 链 上 观点 
j 稻 的 累加 ,从 表 6 与 表 7 可 以 看 出 ,在 2 月 11 日 与 
1 都 处 于 较 高 的 演化 等 级 ,观点 团 徐 的 情感 强度 、 
于 禾 规 模 和 传播 范围 都 有 较 大 幅度 的 增长 ,说 明 11 与 
1 目的 观点 团 禾 有 较为 明显 的 演化 现象 ,原因 是 11 日 
: 拒 训 电影 学 院 宣布 成 立 调查 组 对 翟 天 临 论文 抄袭 事件 
进 答 调 查 , 引 发 11 与 12 日 连续 两 天 的 网 民 大 规模 讨 
论 彩 成 网 络 与 情 热 度 高 峰 ,观点 团 比 演化 等 级 在 识别 
网 络 奥 情 演化 高 峰 的 辨识 上 具有 较 好 的 效果 。 

实证 结果 讨论 

对 于 以 “ 翟 天 临 知 网 事件 "为 实证 对 象 的 网 络 与 


情 观点 团 复 演化 等 级 测度 结果 表明 ,观点 团 复 演化 等 
级 测度 模型 能 够 提供 各 个 观点 团 簇 在 传播 范围 .情感 
强度 .群体 规模 .语义 内 涵 等 多 个 方面 的 准确 数据 , 通 
过 观测 观点 团 簇 的 演化 属性 数值 能 够 极 快 的 掌握 当前 
事件 中 影响 能 力 最 强 的 观点 团 簇 , 而 对 该 团 簇 进行 解 
构 可 以 提取 出 团 篮 中 的 关键 用 户 的 信息 ,并 实施 具有 
针对 性 的 观点 引导 策略 。 同 时 ,根据 进一步 计算 的 观 
点 团 篮 演化 等 级 能 够 清晰 地 辨识 观点 团 复 的 演化 状 
态 ,为 网 络 与 情 管控 的 快速 反应 与 靶 向 引导 提供 依据 。 
通过 对 实证 结果 的 分 析 发 现 :中 网 络 与 情 观 点 团 禾 演 
化 等 级 可 应 用 于 识别 网 络 与 情 中 的 群体 观点 在 时 间 维 
度 上 的 演化 程度 。 例 如 ,在 本 文案 例 “ 翟 天 临 知 网 事 
件 " 中 ,在 12 日 事件 有 新 的 进展 并 产生 与 情 热 点 ,通过 
对 该 事件 的 观点 团 簇 演化 等 级 测度 后 得 知 在 12 日 中 
演化 等 级 最 高 ,表明 本 文 方 法 在 识别 观点 团 篮 的 演化 


上 具有 较 好 的 效果 。 书 网络 与 情 观 点 团 禾 的 演化 属性 
数值 同样 能 够 作为 与 情 引导 的 参考 依据 ,从 实证 数据 
中 可 以 看 出 ,在 该 事件 中 呈现 负 向 情感 强度 的 观点 团 
篮 的 各 项 属性 数值 蕴 远 远大 于 正 向 情感 的 观点 团 篮 ， 
其 中 涉及 到 广大 网 友 最 为 关注 的 问题 的 观点 团 簇 的 属 
性 数值 也 远大 于 其 他 观点 团 簇 ,因此 在 实际 与 情 管控 
工作 中 可 以 根据 观点 团 禾 的 属性 数据 进行 有 的 放 矢 的 
靶 向 管控 。 同 时 ,在 某 个 时 间 点 上 的 演化 链 数 量 也 表 
示 了 该 事件 的 观点 群体 数量 , 越 多 的 演化 链 则 群体 观 
点 越 繁 杂 。@ 网 络 与 情 观点 团 复 演 化 等 级 与 演化 属性 
数据 可 以 清晰 地 表示 目前 网 络 与 情 的 演化 态势 ,并 且 
通过 对 照 前 序 时 间 节 点 中 观点 团 簇 的 各 项 数据 能 够 得 
知 处 于 同一 演化 链 上 的 观点 团 篮 的 情感 ,规模 .语义 内 
涵 \ 传 播 范围 等 信息 的 变化 情况 ,提供 多 元 化 的 数据 支 
撑 。 


5 结语 


笔者 在 理论 层面 对 网 络 与 情 观 点 团 簇 概念 进行 辨 
析 ,为 网 络 与 情 观 点 演化 的 测度 提供 新 的 思路 。 在 实 
践 层面 ,构建 了 网 络 与 情 观 点 团 簇 演化 等 级 测度 模型 ， 
以 “ 翟 天 临 知 网 事件 ”为 实证 案例 ,对 演化 等 级 这 一 指 
标的 准确 性 与 可 靠 性 进行 验证 ,结果 显示 ,网 络 与 情 观 
点 团 复 演化 等 级 能 够 精准 的 体现 网 络 与 情 群 体 思维 的 
变化 水 平 与 演化 程度 ,在 网 络 与 情 监管 与 预警 上 具有 
良好 的 适用 性 。 

本 文 在 研究 中 同样 存在 一 定局 限 性 :中 在 观点 团 
复 的 划分 上 基于 LDA 模型 对 网 络 与 情 进 行 观点 团 复 
划分 ,划分 准确 性 有 待 提高 ;书本 文 主要 对 文本 类 型 网 
络 与 情 的 观点 团 簇 演化 进行 辨别 ,缺少 对 图 片 .视频 等 
多 媒体 内 容 演 化 状态 的 识别 ;本 文 所 提出 的 方法 无 
法 对 观点 团 簇 演化 的 未 来 趋势 进行 预测 , 仅 能 对 当前 
时 间 节 点 上 的 演化 等 级 进行 测度 。 因 此 在 下 一 阶段 研 
究 中 ,作者 将 对 上 述 局 限 进行 优化 ,在 提高 观点 团 复 划 
分 准确 率 与 适应 多 媒体 网 络 与 情 观点 团 簇 演 化 感知 的 
基础 上 ,利用 神经 网 络 对 观点 团 复 的 未 来 演化 趋势 进 
行 预测 ,以 便于 相关 部 门 更 好 地 管控 网 络 与 情 。 
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Abstract: | Purpose/significance | Proposing and constructing the evolution level of Internet public opinion 
_Shasters is to describe the evolution degree of the group opinion state of Internet public opinion audiences over time 
Sdd events. lt is of great theoretical and practical significance for Internet public opinion guidance and precise guid- 
(Re | Method/ process | Based on LDA and CNN neural Internet the paper constructed a level measurement mod- 
mel=of Internet public opinion cluster evolution, and took “ Zhai Tianlin CNKI event” as the experimental object to ver- 
the effectiveness of the index of evolution level. | Result/conclusion | The evolution level of Internet public opin- 
ion cluster can well reflect the evolution of Internet hot event group opinion state. Tt can show the attribute values of 
three dimensions and also reflect the evolution degree of opinion clusters compared with the node state of the previous 
time. The evolution level measurement results of opinion cluster in this paper accurately reflect each evolution peak of 
event opinion. It provides a new direction for the relevant departments to target and guide the opinions of Internet 
public opinion groups. 


Keywords: Internet public opinion opinion cluster opinion evolution evolution level measurement model 
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